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动态 加 权 网 络 中 的 演化 社区 发 现 算法 研究 
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摘 要 : 在 动态 网 络 中 发 现 社区 结构 是 一 个 非常 复杂 而 有 意义 的 过 程 ， 可 以 更 好 地 观察 和 分 析 网 络 的 演化 情况 。 针 对 
动态 加 权 网 络 中 的 社区 发 现 问题 ， 提 出 了 一 种 结合 历史 网 络 社区 结构 的 算法 ， 叫 做 动态 加 权 网 络 中 的 演化 社区 发 现 算 
法 (ECDA)。 该 算法 分 为 两 步 : 结合 历史 社区 和 网 络 结构 信息 ， 计 算 当 前 时 间 跳 的 输入 给 阵 ; 然后 通过 该 输入 和 王 阵 计 
算得 到 结合 历史 时 间 跳 信息 的 社区 划分 结果 。 该 算法 有 以 下 优点 : 可 以 自动 发 现 动态 加 权 网 络 中 每 个 时 间 跳 的 社区 结 
构 ; 对 网 络 结构 的 变化 和 社区 结构 的 变化 具有 较 高 的 敏锐 性 。 在 人 工 数 据 集 和 真实 数据 集中 进行 了 实验 ， 实 验 结果 证 
明 该 算法 可 以 有 效 地 发 现 动 态 加 权 网 络 中 的 社区 结构 ， 与 其 他 算法 相 比 有 具有 较 好 的 竞争 力 。 
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Research on evolutionary community discovery algorithm in dynamic weighted networks 


Zhang Gaozhen, Zhang Xiankun, Su Jing, Liu Yuanbo 
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Abstract: In dynamic networks, detecting community structure is a very complex and meaningful process, which can better 
observe and analyze the evolution of the networks. For the community detection problem in dynamic weighted networks, this 
paper proposed an algorithm combining the community structure of the historical networks, called the evolutionary community 
discovery algorithm (ECDA) in dynamic weighted networks. The algorithm is divided into two steps: calculate the input matrix 
of the current timestep by combining the information of historical communities and network structure; and then calculate the 
result of community detection combining the historical timestep information through the input matrix. The algorithm has the 
following advantages: it can automatically discover the community structure of each timestep in the dynamic weighted network; 
the algorithm has a high sensitivity to the changes of network structure and the changes of community structure. And the 
experimental results show that the proposed algorithm can effectively detect the community structure in dynamic weighted 
networks, and it is quite competitive with other algorithms. 
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构 也 随 着 时 间 有 所 变化 鲁 。 网 络 存 在 的 动态 性 增加 了 网 络 衬 


区 


0 5 引言 发 现 问题 研究 的 复杂 性 ， 而 针对 静态 网 络 的 分 析 因 为 其 不 考虑 
于 复杂 系统 可 以 用 复杂 网 络 进行 表示 , 例如 :社会 网 络 、 动态 网 络 中 时 间 的 参与 而 丢失 了 捕捉 社区 进化 模式 的 机 会 ， 在 

邮件 网 络 、 生 物 网 络 以 及 技术 网 络 等 ， 因 此 得 到 了 研究 人 员 的 。” ”一定 程度 上 无 法 反映 出 动态 网 络 中 社区 变化 的 动态 性 特点 ， 影 

广泛 研究 和 探索 。 近 年 来 ， 随 着 复杂 网 络 研究 的 深入 ， 人 们 发 向 网 络 分 析 结 果 的 准确 性 。 因 此 ， 关 于 动态 网 络 社区 发 现 的 研 

现 很 多 实际 网 络 都 是 由 社区 构成 的 罩 。 复 杂 网 络 内 部 连接 紧密 。 究 引发 学 者 广泛 关注 ， 它 已 成 为 社区 发 现 研究 工作 中 一 个 热点 

的 节点 组 成 的 集合 称 为 社区 。 同 一 个 社区 内 部 的 节点 之 间 联 系 问题 。 

较为 密切 ,而 社区 之 间 的 节点 联系 则 较为 松散 C71。 传统 的 社会 动态 网 络 演化 社区 发 现 的 主要 目标 是 发 现 不 同时 刻下 的 社 


网 络 分 析 方 法 专注 于 静态 网 络 的 研究 ， 主 要 研究 如 何在 网 络 中 区 结构 ， 主 要 研究 的 是 发 现 动态 社区 结构 的 方法 ， 并 以 此 来 揭 


确定 有 意义 的 社区 结构 。 但 是 在 许多 复杂 网 络 中 ， 实 体 间 的 交 。 ” 示 网 络 中 隐 仿 的 不 断 动 态 变 化 的 社区 结构 中。 网 络 的 动态 怕 


= 
LAE 


互 是 随时 间 动 态 变 化 的 ， 而 网 络 的 变化 必然 导致 其 中 的 社区 结 ”” 指 网 络 的 成 员 与 成 员 之 间 的 相互 关系 会 随时 间 的 变化 而 变化 。 


基金 项 目 : 国家 自然 科学 基金 资助 项 目 (61702367) 
作者 简介 : 张 高 祯 〈1993-)， 男 ， 河 南 周口 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 智能 信息 处 理 ; 张 贤 坤 《1970-)， 男 ， 安 徽 芜湖 人 ， 教 授 ,博士 ,主要 研究 
方向 为 智能 信息 处 理 ; 苏 静 (1977-)， 女 ， 天 津 人 ， 副 教授 ， 博 士 ， 主 要 研究 方向 为 社会 网 络 分 析 ; 刘 渊 博 (1992-)， 女 ， 山 西 太原 人 人， 硕士 研 究 生 ， 主 要 研 
究 方向 为 智能 信息 处 理 . 


201805.00073v1 


chinaXiv 


录用 稿 


国内 外 获取 动态 


是 基于 两 步 分 析 策 略 的 社区 结构 演化 方法 。 首 先 ， 对 社 
划分 ， 按 照 一 定时 间 窗 口 


数据 进行 时 间 跳 
各 个 时 间 跳 的 社 


网 络 社 


区 结构 


特征 并 且 随 时 间 
已经 提出 了 许多 


检测 演化 和 


区 结构 的 算法 可 大 致 分 为 两 类 。 第 一 类 


， 追 踪 相 同 社 


区 网 络 
集成 数据 ， 然 后 计算 


区 在 连续 时 间 跳 中 的 演化 


的 推移 解释 这 些 社区 结构 之 间 的 差异 。 
区 结构 的 两 步 策略 算法 .Gergely 等 


近年 来 ， 


人 (9 开发 了 一 种 基于 clique percolation 的 新 算法 ， 该 算法 首次 


允许 在 大 范围 内 


对 重 舍 


社区 的 时 间 依 赖 怕 


宪 而， 省 述 了 社 


种 基于 不 同时 间 
跟踪 大 型 联网 中 


跳 快照 


不 断 变化 的 社 


进行 研究 ， 


以 此 为 


区 演化 的 基本 关系 。Hopcroft 等 人 60 提出 了 一 


的 节点 余弦 相似 度 的 跟踪 聚 类 方法 ， 以 


区 。Duan 


Takaffoli 等 人 03] 


移 有 效 地 识别 和 跟踪 类 似 的 社区 。 在 这 些 研究 中 ， 社 
化 分 别 在 两 个 阶段 进行 分 析 。 历 史 的 社 


社区 演 


区 挖掘 算法 ,包括 社 


提出 了 


区 发 现 和 动态 加 权 有 


等 人 0 提出 了 一 种 社 


向 图 上 的 变化 点 检测 。 


一 种 社区 匹配 算法 ， 以 便 随 着 时 间 的 推 


， 社 区 发 现 和 
结构 ， 包 括 与 


当前 社 


x 结构 有 关 的 有 价值 的 
第 二 类 方法 考虑 了 历史 网 络 社区 结构 


区 
言 息 ， 没 有 被 考虑 在 内 。 


祝 息 的 影响 。 根 据 动 


态 网 络 缓慢 演变 的 情况 ，Chakrabarti 等 人 04 首 先 提出 了 演化 聚 


类 的 框架 。 在 这 


突 的 条 件 : 一 个 是 任何 时 间 跳 


个 框架 下 ， 演 化 聚 类 应 该 同时 
4 聚 类 应 该 尽 可 能 保持 对 当前 数 
据 的 忠实 (或 者 一 致 性 ); 另 一 个 是 聚 类 结果 不 应 该 从 一 个 时 间 
跳 到 下 一 个 时 间 跳 发 生 显著 的 变化 。Chiti 引 提出 了 一 个 谱 聚 类 
， 该 算法 通过 优化 ! 


进化 算法 
函数 挖掘 动态 社 


至 此 ， 动 态 社 


区 结构 


Lin09 提 出 了 


个 经 


现 ， 该 算法 采用 


演化 ， 同 时 ，FacetNet 采用 日 


快照 代价 和 时 间 
,快照 代价 衡量 当前 时 刻下 的 聚 类 质量 
时 间 代 价 衡量 当前 时 刻 和 上 一 四 
区 发 现 问题 可 转换 为 优化 
的 FacetNet 框架 模型 来 实现 动态 社 
了 非 负 和 拖 阵 分 解 的 方法 同时 分 析 社区 和 它 
的 和 迭代 求解 方式 可 以 保证 算法 最 终 


优化 两 个 潜在 冲 


尺 价 组 成 的 代价 


寺 刻 之 间 聚 类 结果 的 相似 程度 。 
代价 函数 的 优化 问题 。 


区 发 
门 的 


收敛 到 一 个 局 部 最 优 解 , 但 FacetNet 存在 的 问题 在 于 其 划分 结 


出 一 种 动态 复杂 


09 提 出 了 一 种 动态 加 权 网 络 中 的 演化 社 
展 社 区 以 及 合并 社 


该 算法 在 初始 社 


果 的 质量 依赖 于 网 络 中 社区 的 数目 。 


网 络 中 


Elham Havvaei 等 人 07 提 


发 现 重 疮 社区 的 博弈 论 方法 。Guo 等 人 


区 结构 发 现 算法 , 但 是 


又、 扩 


区 的 每 个 演化 步骤 中 


都 需要 人 为 的 设 定 闵 值 ， 不 同 的 阔 值 设 定 对 算法 的 结果 具有 较 


大 的 影响 。 


在 本 文中 ， 提 出 了 一 种 动态 加 权 网 络 中 的 演化 社区 发 现 算 
法 (ECDA)。 借 鉴 在 大 型 网 络 中 社区 快速 演变 算法 09， 


本 文 有 


1 ”相关 概念 


动态 加 权 网 络 
个 具有 了 个 时 间 跳 的 动态 网 络 可 以 用 一 个 网 络 序 列 
G={G,G,.sGr} 表示 。 令 G=(W,E) 表示 在 时 间 跳 1 
(1<1<7T ) 时 刻 的 网 络 结构 ， 其 中 ，V = fw 表示 GG, 
网 络 中 节点 的 集合 ，W' 表示 G, 网 络 中 的 节点 数 ; 
已 ={el,@,…,@ij'} 表示 G, 网 络 中 的 边 集 ，M' 表示 G 网 络 中 的 
边 数 ， 如 果 边 集 不 全 为 1， 那么 G, 就 是 一 个 加 权 网 络 。 如 果 
在 动态 网 络 G 中 存在 一 个 时 间 跳 的 网 络 C 为 加 权 网 络 ， 那 么 ， 
G 就 是 一 个 动态 加 权 网 络 。 

一 般 地 ， 在 每 一 个 时 间 跳 1 时 刻 的 网 络 G, 都 可 以 用 一 个 邻 
接 矩 阵 4 =(wW) ww 表示 , 其 中 ，W 表示 节点 vi 与 节点 Vv 之 间 
连接 边 的 权重 :如果 节 点 vi 与 节点 vi 之 间 没 有 边 相 连 ， 那 么 ， 
w=0 。 对 于 一 个 在 时 间 跳 ! ， 具 有 N' 个 节点 的 网 络 G,， 第 i 
个 节点 的 度 定义 为 所 有 与 节点 i 相连 的 边 的 权重 之 和 ， 公 式 化 
表示 为 : 


1.1 


区 1 
d= >, 


之 O 
其 中 :T={1,2,...,N'}。 
1.2 输入 邻接 和 矩阵 

为 了 发 现 动态 加 权 网 络 中 的 演化 社区 ， 必 须要 考虑 以 下 的 
两 个 潜在 条 件 : 任何 时 间 跳 的 聚 类 结果 应 尽 可 能 保持 对 当前 数 
据 的 忠实 性 (或 者 一 致 性 ); 聚 类 结果 不 应 该 从 一 个 时 间 跳 到 下 
一 个 时 间 跳 发 生 显著 的 变化 。 对 于 动态 加 权 网 络 中 ， 时 间 跳 
时 刻 的 加 权 网 络 G,( 用 邻接 矩阵 A = (Ww) 表示 ), 本 文 定义 
一 个 输入 矩阵 芒 =(u) yw ， 和 矩阵 中 的 每 一 个 元 素 定义 如 下 nl 


1 Wy ift=1 
Us; - (cv +CQ OF if122 3? 
其 中 : & 是 一 个 用 户 自 定义 的 参数 ， 其 范围 是 a e[0,1] ; 
1 for 
O; ee 1 otherwise G3) 


其 中 : C=C 表示 在 时 间 跳 1-1 时 刻 节 点 i 和 节点 j 属于 同 
一 个 社区 。 

本 文 对 她 做 如 下 解释 。 对 于 动态 加 权 网 络 G ， 在 时 间 跳 
t=1 时 刻 的 网 络 是 初始 加 权 网 络 ， 此 时 不 存在 1-1 时 间 跳 网 络 ; 
因此 ， 此 时 的 输入 矩阵 U' 就 等 于 加 权 网 络 的 邻接 矩阵 4 。 当 
tf>2 时 , 此 时 的 输入 矩阵 UV' 要 综合 考虑 当前 时 间 跳 1 时 刻 加 权 


效 解决 了 在 演化 社区 结构 发 现 算法 中 对 初始 社区 、 扩 展 社 区 以 ” 网 络 的 邻接 和 矩阵 4' 的 信息 和 历史 时 间 跳 的 加 权 网 络 信 息 以 及 
及 合并 社区 步骤 阔 值 设 定 的 人 为 干预 问题 。 在 本 文 提 出 的 历史 社区 结构 信息 。 参 数 & 是 一 个 用 于 平衡 上 述 两 个 条 件 的 用 
ECDA 算法 中 ， 其 可 以 自动 发 现 动态 加 权 网 络 中 每 个 时 间 跳 的 户 自 定义 参数 ，&% 越 大 越 侧重 于 强调 历史 网 络 和 历史 社区 结构 
社区 结构 。 并 且 该 算法 对 网 络 结构 的 变化 和 社区 结构 的 变化 具 言 息 。 随 着 1 的 增加 ， 历 史 时 间 跳 的 网 络 和 社区 结构 信息 的 影 


有 较 高 的 敏锐 性 。 


该 算法 在 人 工 数据 集 和 真实 数据 集中 进行 了 


实验 ， 实 验 结果 证 明 该 算法 可 以 有 效 地 发 现 动态 加 权 网 络 中 的 


社区 结构 ， 与 其 他 算法 对 比 


有 较 好 的 竞争 力 。 


响 会 变 得 越 来 越 小 。 

1.3 ”模块 度 

模块 度 也 称 模块 化 度量 值 ， 是 由 Newman 和 Girvan 上 提出 
] 于 衡量 网 络 社区 结构 强度 的 方法 。 其 定义 为 社区 内 部 的 总 


的 | 
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边 数 和 网 络 中 总 边 数 的 比例 减 去 一 个 期 望 值 ， 该 期 望 值 是 将 网 
络 设 定 为 随机 网 络 时 同样 的 社区 分 配 所 形成 的 社区 内 部 的 总 边 
数 和 网 络 中 总 边 数 的 比例 。 为 了 方便 计算 , NewmanP9 基 于 邻接 
矩阵 重 写 了 模块 度 函 数 。 下 面 本 文 给 出 动态 加 权 网 络 在 时 间 跳 
1 时 刻 的 模块 度 : 


1 1 did; 1 
o -二 中- 后] (4) 


= 表示 输入 


iel' 


其 中 : 4 = 过 表示 输入 矩阵 节点 ;的 度 ; 


模块 度 的 值 小 于 1， 也 可 能 为 负 值 。 模 块 度 的 值 越 大 ， 说 
明 划 分 的 社区 结构 越 稳定 。 当 模块 度 值 达到 最 大 ， 接 近 1 时 ， 
表明 此 时 社区 结构 达到 最 强 。 当 整个 网 络 被 看 做 一 个 社区 时 ， 
此 时 的 模块 度 值 就 是 0。 对 于 一 个 网 络 划 分 ， 当 社区 内 边 的 个 


本 1 1 A —. 
矩阵 节点 了 的 度 ，m = 之 光 表 示 输 入 矩阵 UV' 的 边 的 权重 和 。 


3: 计算 输入 矩阵 U'。 
4: 将 输入 矩阵 UV' 中 的 每 个 节点 看 做 一 个 独立 的 社区 ， 其 中 的 社区 数 与 
节点 个 数 相同 。 


5; 对 每 一 个 节点 了 


xl 


良 次 尝试 把 节点 i 分 配 到 其 邻居 节点 所 在 的 社 
计算 分 配 前 后 的 模块 度 增益 AO' ， 并 记录 AQ: 最 大 的 邻居 节点 。 如 果 
maxAO' > 0， 则 把 节点 i 分 配 到 AO' 最 大 的 邻居 节点 所 在 的 社区 ; 否 
则 保持 不 变 。 
6: 重复 步骤 5， 直到 所 有 节点 所 属 的 社区 不 再 发 生变 化 。 

行 压缩 ， 将 所 有 在 同一 个 社区 的 节点 压缩 成 一 个 新 的 节点 ， 
社区 内 节点 之 间 的 边 的 权重 转换 为 新 节点 自身 的 权重 。 社 区 间 边 的 权重 
转换 为 新 节点 间 的 权重 。 
8: 重复 步骤 4.7， 直 到 整个 网 络 的 模块 度 不 在 发 生变 化 为 止 。 


9: 1€1t+1。 


XxX, 


Xx 


7: 对 社区 ; 


EE 


LL 


16: end 
在 步骤 5 中 ， 本 文 只 是 想 通 过 模块 都 增益 来 判断 一 个 节点 
i 是 否 可 以 加 入 社区 C' 中， 所 以 在 实际 中 不 必 求 出 精确 的 模块 


数 小 于 在 随机 网 络 中 期 望 的 边 个 数 时 ， 模 块 度 的 值 可 能 为 0 或 
者 为 负 值 ; 在 这 种 情况 下 , 根据 Newman 和 Girvan 的 定义 ， 模 
块 度 的 值 为 0。 对 于 大 多 数 网 络 而 言 ， 模 块 度 2 的 值 在 区 间 
[0.3,0.7] 。 

模块 度 增益 公式 AQ 是 由 Vincent 等 人 09 在 大 型 网 络 中 社 


度 值 ， 仅 需要 知道 当前 操作 模块 度 增 益 值 是 否 大 于 0 即 可 ， 攻 
此 ， 本 文 得 到 模块 度 相 对 增益 公式 : 


AQ'=4d', - 二 wx (0) 


bin t 


这 里 ， 模 块 度 相对 增益 的 值 可 能 大 于 1， 但 其 不 是 真实 的 


区 快速 演变 算法 中 提出 的 。 下 面 本 文 给 出 动态 加 权 网 络 中 ， 在 
时 间 跳 1 时 刻 的 模块 度 增益 AC 为 

“| 9 
其 中 ， 2 表示 在 时 间 跳 1: 时刻 社 区 C' 内 所 有 边 的 权重 之 和 ; 
>》 表示 在 时 间 跳 1 时 刻 其 他 节点 与 社区 C' 内 节点 相连 的 边 
的 权重 之 和 ; di;, 表示 在 时 间 跳 1 时 刻 节点 i 与 社区 C' 内 节点 相 
连 的 边 的 权重 之 和 。 本 文通 过 计算 节点 分 配 前 后 的 模块 度 增益 
AO ， 并 记录 AQ' 最 大 的 那个 邻居 节点 ， 如 果 maxAO' >0， 则 
把 该 节点 分 配 到 AQ' 最 大 的 那个 邻居 节点 所 在 的 社区 ， 和 否则 保 
持 不 变 。 


2 ”算法 描述 
基于 在 第 1 章 定 义 的 输入 矩阵 ， 本 文 提出 了 一 种 动态 加 权 
网 络 中 的 演化 社区 发 现 算法 (ECDA)， 其 主要 由 两 部 分 组 成 ; 
计算 输入 矩阵 和 基于 输入 矩阵 进行 演化 社区 发 现 。 动 态 加 权 网 
络 中 的 演化 社区 发 现 算法 的 详细 描述 见 算法 1。 

算法 1: 动态 加 权 网 络 中 的 演化 社区 发 现 算法 (ECDA) 


给 出 : 社区 序列 {Ci,C,…,C,} ,其 中 1<t < 了， 表示 + 时 间 跳 的 社 


站 


1: 1《-1。 


2: whilet <T do 


模块 度 增 益 值 ， 然 而 它 的 正 负 结果 表示 了 当前 操作 是 否 增加 了 
模块 度 。 因 此 ， 使 用 该 模块 度 相 对 增益 公式 可 以 大 大 降低 算法 
的 时 间 复 杂 度 。 

算法 复杂 度 分 析 。 在 计算 输入 矩阵 时 的 计算 复杂 度 是 0(D) ; 
在 计算 基于 输入 抢 阵 进行 演化 社区 发 现时 的 计算 复杂 度 是 
O(e) ; 因此 , 可 得 在 每 个 时 间 跳 的 时 间 复 杂 度 为 0(e) 。 所 以 ， 
整个 动态 网 络 的 计算 复杂 度 即 为 CO(e ) 。 


3 ”实验 结果 与 分 析 


在 这 里 ， 本 文 使 用 了 两 个 人 工 网 络 和 一 个 真实 网 络 〈 科 学 
家 研究 合作 网 络 数据 集 ), 用 于 评价 动态 加 权 网 络 中 的 演化 社区 
发 现 算法 (ECDA) 的 性 能 。 本 文 使 用 了 三 个 划分 质量 评价 函数 
去 测量 得 到 的 社区 结构 58。 第 一 个 函数 是 快照 质量 函数 ， 用 于 
评价 当前 社区 划分 结果 关于 当前 网 络 数据 的 一 致 性 。 快 照 质 量 
评价 结果 越 高 ， 表 明 社区 划分 结果 越 忠 实 于 当前 时 间 跳 网 络 数 
据 。 快 照 质量 函数 如 下 : 


2m 


did’ 
SO' = 一 w’—— 6 
: | 271 | | " 


这 里 ，4! 表 示 1 时 间 跳 的 网 络 4 中 节点 的 度 ，d' 表示 + 时 
间 跳 的 网 络 4 中 节点 j 的 度 ; jr i 表示 + 时间 跳 的 网 络 4 中 所 
有 边 的 权重 和 ; 其 他 参数 含义 同上 。 

第 二 个 函数 是 历史 质量 函数 ， 用 于 测量 当前 社区 划分 结构 
关于 历史 网 络 信息 和 社区 结构 信息 拟 合 效果 的 瞬时 平滑 性 。 若 
得 到 的 历史 质量 评价 结果 较 高 ， 说 明 此 时 的 社区 划分 结构 在 上 
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一 时 间 跳 到 当前 时 间 跳 之 间 没 有 发 生 显著 的 变化 。 把 当前 时 间 
跳 的 社区 划分 结果 应 用 到 上 一 时 间 跳 的 数据 中 ， 得 到 历史 质量 


1 dt de 
H 1 0 wi! Em, J 加 
2 = 2 (8) 


这 里 ，d 站 表示 +-1 时 间 跳 的 网 络 4" 中 节点 i 的 度 ，d 让 
表示 1+-1 时 间 跳 的 网 络 4 中 节点 j 的 度 ，m”"' 表示 :1 时间 
跳 的 网 络 4- 中 所 有 边 的 权重 和 ;， 其 他 参数 信义 同上 。 

最 后 一 个 函数 是 整体 质量 函数 ， 用 于 评价 平衡 两 个 潜在 冲 
突 条 件 后 的 网 络 整体 划分 质量 。 整 体质 量 评 价 结果 越 高 ， 表 明 
网 络 社区 划分 结果 整体 质量 越 高 。 整 体质 量 函 数 如 下 : 


下 did; 1 
WD 6,. (9) 


这 里 ，d; 表示 1 时 间 跳 的 输入 矩阵 U' 中 节点 i 的 度 ; di 表 
示 t 时 间 跳 的 输入 和 矩阵 U' 中 节点 j 的 度 ; m' 表示 1 时 间 跳 的 输 
入 矩阵 UV' 中 所 有 边 的 权重 和 ; 其 他 参数 含义 同上 。 
在 这 里 , 本 文 实现 并 改进 了 Guo 等 人 (3 提出 的 动态 加 权 网 
络 中 的 演化 社区 结构 发 现 算法 (ECSD )。 本 文 对 ECSD 算法 中 
扩展 社区 、 合 并 社区 步骤 进行 了 优化 ;本 文 在 ECSD 扩展 社区 


i,jel' ,izj 


时 选择 节点 对 社区 模块 度 贡献 最 大 且 大 于 阐 值 的 社区 进行 加 入 ; 


在 ECSD 算法 合并 社区 时 选择 两 两 合并 时 模块 度 最 大 且 大 于 设 
定 的 阔 值 的 两 个 社区 进行 合并 。 并 与 本 文 提 出 的 算法 (ECDA) 
进行 了 对 比 实验 ， 从 而 证 明了 本 文 提出 的 动态 加 权 网 络 中 的 演 
化 社区 发 现 算 法 (ECDA) 的 有 效 性 和 竞争 力 。 

本 文 提出 的 算法 (ECDA ) 还 与 ECSD 算法 、PDG 算法 PH 
和 InfoMap 算法 PC 进行 了 每 个 时 间 跳 社区 划分 质量 的 模块 度 对 
比 实验 。 由 于 PDG 算法 和 InfoMap 只 能 用 于 非 加 权 的 网 络 , 所 
以 本 文 在 这 里 只 在 非 加 权 的 人 工 网 络 和 真实 网 络 中 进行 了 每 个 
时 间 跳 的 模块 度 对 比 实验 。 通 过 分 析 其 他 文献 的 模块 度 评价 对 
比 指标 ， 发 现 他 们 的 模块 度 质量 评价 指标 就 是 本 文 上 述 的 三 个 
评价 函数 中 的 快照 评价 SQ); 为 了 保持 与 其 他 文献 说 法 上 的 
一 致 性 ， 本 文 这 里 也 采用 模块 度 质量 评价 的 叫 法 。 
3.1 人 工 网 络 


在 这 里 ， 本 文 使 用 了 两 个 人 工 网 络 用 于 验证 本 文 提出 算法 
(ECDA) 的 有 效 性 ， 它 们 分 别 是 Guo 等 人 使 用 的 小 规模 动态 
加 权 网 络 数 据 集 和 使 用 LFR 生成 的 人 工 网 络 数据 集 。 


3.1.1 小 规模 动态 加 权 网 络 
在 这 个 小 规模 动态 加 权 网 络 089 中 ， 每 一 个 时 间 跳 中 的 节点 
和 边 都 是 不 断 变 化 的 ， 得 到 的 社区 结构 也 是 随 着 时 间 不 断 变化 
的 。 本 文 使 用 该 人 工 网 络 测试 所 提出 算法 (ECDA) 的 有 效 性 。 
初始 的 动态 加 权 网 络 如 图 1 所 示 。 

从 图 1 中 ,可 以 观察 到 在 时 间 跳 1 时 的 网 络 中 有 7 个 节点 ， 
它们 可 以 被 划分 成 2 个 社区 。 然 而 ， 在 时 间 跳 2 时 的 网 络 节 点 
数 、 边 数 和 边 权 重 都 发 生 了 变化 ; 例如， 节点 2 与 节点 3 之 间 


的 边 消 失 了 ， 新 增 了 一 个 节点 8 等 。 在 时 间 跳 3 时 的 网 络 的 边 
数 以 及 边 权重 也 发 生 了 变化 。 在 时 间 跳 4 时 的 网 络 可 以 明显 被 
划分 成 3 个 社区 。 值 得 注意 的 是 ， 在 时 间 跳 2 时 的 网 络 中 的 节 
点 5 可 以 被 划分 到 两 个 社区 中 《节点 1，2，3,，4 组 成 的 社区 和 
节点 6，7，8 组 成 的 社区 ); 但 是 参考 时 间 跳 1 时 的 网 络 划分 ， 
应 该 把 节点 5 划分 到 第 二 个 社区 (节点 6, 7, 8 所 组 成 的 社区 ) 

中 ;在 这 种 情况 下 ， 就 可 以 看 到 历史 网 络 和 社区 信息 就 变 得 非 
常 重要 。 


b 1 6 
部 1 1 
2 弛 一 一 | 流 2| 8 
1 
3 网 
d 口 5 
国 盖 :国力 |」 力 
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图 1 初始 动态 加 权 网 络 ， 
其 中 a，b，c 和 d 分 别 表示 在 时 间 跳 1，2，3 和 4 时 刻 的 网 络 结 


表 1 在 人 工 动态 加 权 网 络 中 每 个 时 间 跳 的 
SQ、HQ 和 TQ 的 评价 结果 


质量 评价 ”时间 跳 1 ”时间 跳 2 ”时 间 跳 3 ”时 间 跳 4 
SQ 0.550 0.568 0.642 0.738 
HQ -- 0.550 0.509 0.642 
TQ 0.550 0.578 0.626 0.737 


图 2 在 人 工 动态 加 权 网 络 中 使 
a，b，c 和 d 分别 代表 在 时 间 跳 1，2，3 和 4 时 的 社区 划分 结果 


使 用 ECDA 算法 在 这 个 人 工 动态 加 权 网 络 中 的 划分 结果 如 
图 2 所 示 。 本 文 在 表 1 中 给 出 了 快照 评价 结果 (SQ)、 历 史 评 
价 结 果 (HQ) 和 整体 评价 结果 (TQ) 的 详细 信息 。 在 时 间 跳 1 
时 ， 由 于 没有 历史 网 络 信息 和 历史 社区 结构 信息 ， 所 以 没有 历 
史 评 价 结果 ; 而且 由 第 二 部 分 的 介绍 可 知 ， 此 时 的 快照 质量 评 
价 就 等 于 整体 质量 评价 。 同 时 ， 本 文 给 出 了 ECDA 算法 在 该 人 
工 网 络 中 对 比 ECSD 算法 的 实验 结果 ， 如 图 3 所 示 ， 证 明了 本 
文 提 出 的 算法 的 有 效 性 和 竞争 力 。 
3.1.2 LFR 人 工 网 络 

本 文 使 用 LFR 生成 了 四 个 数据 集 , 然后 以 这 四 个 数据 集 为 
四 个 时 间 跳 进行 实验 ,生成 网 络 的 参数 设置 如 表 2 所 示 。 其 中 ， 
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NN 表示 节点 数 ; k 节点 的 平均 度 ; maxk 表示 节点 的 最 大 度 ; mu ”结构 信息 拟 合 效 果 的 瞬时 平滑 性 ， 如 果 网 络 结构 和 社区 结构 在 
表示 混合 参数 ，minc 表示 最 小 社区 尺寸 ，maxc 表示 最 大 社区 不同 时间 跳 之 间 发 生 较 大 波动 ， 那 么 得 到 的 历史 质量 评价 结果 


尺寸 。 自 上 而 下 分 别 是 LFR 生成 四 个 数据 集 的 参数 设置 。 就 会 较 低 。 因 此 ， 在 LFR 网 络 的 历史 评价 (HQ) 结果 中 ， 本 
快照 质量 评价 结果 历史 质量 评价 结果 文 得 到 的 结构 低 于 ECSD 算法 ， 证 明 网 络 和 社区 结构 在 不同 
ea es LFR 生成 网 络 之 间 发 生 了 较 大 变化 , 说 明了 本 文 的 算法 (ECDA) 
8 Goss 对 网 络 结构 的 变化 和 社区 结构 变化 的 敏锐 性 。 
t= 065 区 避 05 
轩 045 快照 质量 评价 结果 历史 质量 评价 结果 
”~ 06 呈 09 0.025 
里 We Ee 0.02 BN 
0.55 355 村 a OM ph -8—ECDA 
, 时 间 跳 序列 时 间 跳 序列 8 0.6 g 
整体 质量 评价 结果 E05 gd 
怪 民 0.005 
以 04 也 
xs | er | = | 


02 0.005 
0.1 -0.01 
1 和 3 4 2 3 4 
LFR 生 成 网 络 序列 LFR 生 成 网 络 序列 
整体 质量 评价 结果 
时 间 跳 序列 a es 
0.7 
图 3 ”人工 动态 加 权 网 络 的 每 个 时 间 跳 网 络 中 ,本 文 提 出 的 算法 Sl 
(ECDA) 与 ECSD 算法 在 三 个 质量 评价 结果 的 对 比 拓 
紧 
| 
0.3 
表 2 使 用 LFR 生成 四 个 网 络 的 相关 参数 设置 值 2 
0.1 
LFR N k maxk mu minc maxc l ER 关内 二 硬 
EU 图 4 在 LFR 网 络 中 ,动态 加 权 网 络 中 的 演化 社区 发 现 算法 (ECDA) 与 


LFR2 1000 25 30 0.2 30 60 


ECSD 算法 在 三 个 质量 评价 结果 的 对 比 


LFR3 1200 25 30 0.2 30 60 
ee 此 外 , 在 该 LFR 网 络 中 , 本 文 提出 的 ECDA 算法 还 与 PDG 


算法 、InfoMap 算法 和 ECSD 算法 进行 了 每 个 时 间 跳 社区 划分 
本 文 使 用 提出 的 动态 加 权 网 络 中 的 演化 社区 发 现 算 法 结果 的 模块 度 质量 对 比 实 验 。 实 验 结果 如 图 5 所 示 。 

(ECDA) 和 对 比 的 ECSD 算法 分 别 在 该 数据 集中 进行 了 实验 。 
在 表 3 中 给 出 了 本 文 的 算法 (ECDA ) 在 LFR 人 工 网 络 中 的 快 
照 评 价 结果 (SQ)、 历史 评价 结果 (HQ) 和 整体 评价 结果 (TQ) 
的 详细 信息 。 

表 3 在 LFR 人 工 网 络 中 每 个 时 间 跳 的 SQ、HQ 和 TQ 的 评价 结果 

质量 评价 LFR1 LFR2 LFR3 LFR4 


模块 度 质量 评价 结果 


SQ 0.688 0.746 0.741 0.744 ! 


2 3 
LFR 生 成 网 络 序列 


HQ — -0.002 0005 -0.001 5 在 LFR 网 络 中 ，ECDA 算法 与 PDG 算法 、InfoMap 算法 和 


ECSD 算法 的 社区 划分 结果 质量 的 模块 度 对 比 


TQ 0.688 0.641 0.653 0.629 


从 表 中 可 以 看 到 ,历史 质量 评价 结果 (HQ) 有 负 值 的 情况 ; 从 图 5 中 , 可 以 看 到 ， 本 文 提出 的 算法 在 该 LFR 网 络 中 整 
原因 是 本 文 使 用 LFR 生成 的 各 个 网 络 之 间 没 有 必然 的 联系 , 也 体 具 有 较 好 的 划分 结果 。 除 了 在 第 一 个 时 间 跳 本 文 的 算法 的 模 
就 是 网 络 之 间 的 变化 较 大 ， 得 到 的 社区 结构 变化 也 比较 大 ; 块 度 略 低 于 PDG 算法 之 外 ; 在 其 他 3 个 时 间 跳 中 , 本 文 提出 的 
此 ， 得 到 负 值 情况 的 历史 质量 评价 结果 (HQ)。 ECDA 算法 都 得 到 了 较 好 的 模块 度 质 量 。 说 明 本 文 提出 的 

同时 , 本 文 给 出 了 ECDA 算法 在 该 LFR 网 络 中 对 比 ECSD ”ECDA 算法 具有 较 好 的 社区 划分 性 能 。 


算法 的 实验 结果 ,如 图 4 所 示 , 证 明了 本 文 提出 的 算法 的 性 能 。 3.2 ”真实 网 络 

从 图 4 的 质量 评价 结果 中 可 以 看 出 ， 本 文 提出 的 动态 加 权 本 文 使 用 了 一 个 真实 网 络 数 据 集 (科学 家 研究 合作 网 络 数 
网 络 中 的 演化 社区 发 现 算法 (ECDA) 在 快照 质量 (SQ) 和 整  ” 据 集 505) 用 于 说 明 本 文 提出 算法 (ECDA ) 的 有 效 性 和 稳定 性 。 
体质 量 (HQ) 评 价 结果 中 具有 较 好 的 结果 。 因 为 历史 质量 (HQ) 科学 家 研究 合作 网 络 是 “985 工程 ”我 国政 府 为 建设 若干 
评价 结果 显示 的 是 当前 社区 划分 结构 关于 历史 网 络 信息 和 社区 ”所 世界 一 流 大 学 和 一 批 国际 知名 的 高 水 平 研究 型 大 学 而 实施 的 
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高 等 教育 建设 工程 大 学 之 
名 称 源 自 1998 年 5 月 4 
设 世 界 一 流 大 学 的 讲话 。 
称 九 校 


关 盟 ， 截 至 2011 年 年 末 ，985 工程 


间 的 校 际 合作 论文 网 络 。“985 工程 ” 
日 ， 江 泽 民 在 北京 大 学 百年 校庆 上 建 
最 初 入 选 985 工程 的 高 校 有 九 所 ， 被 
有 39 所 高 校 。 本 


文中 收集 了 1996 年 至 2003 年 中 国 “985 项 目 ” 大 学 之 间 在 WoS 


上 的 校 际 合作 论文 。 


2002 


2003 


图 6 通过 ECDA 


法 在 19 


96 年 至 2003 年 科学 家 研究 合作 网 络 中 的 


社区 划分 结果 


这 里 ,本 文 按照 每 一 匀 
本文 上 文 提出 的 算法 


网 络 中 的 快照 评 


F 作 为 一 个 时 间 跳 来 组 织 该 动态 网 络 ， 
得 到 的 社区 划分 结果 如 图 6 所 示 。 


网 络 中 对 比 ECSD 算法 的 实验 结果 ， 如 图 


提出 的 算法 的 性 能 。 


ECsD SA 


图 7 在 科学 家 研究 合作 网 络 的 每 个 时 间 跳 网 络 
(ECDA) 与 ECSD 算法 在 三 个 质量 评 


FP， 本 文 提 出 的 算法 
价 结果 的 对 比 


从 上 图 的 评价 结果 中 可 以 看 出 , 本文 提 出 的 ECDA 算法 在 


快照 质量 (SQ) 和 整体 质量 (HQ) 评 价 结果 中 具 
因为 历史 质量 (HQ) 评价 结果 显示 的 是 当 


历史 网 络 信息 和 社 


x 结构 信息 拟 合 效果 的 瞬时 


9 较 好 的 结果 。 
前 社区 划分 结构 关于 
F 滑 性 ， 如果 网 


络 结构 和 社区 结构 在 不 同时 间 跳 发 生 较 大 波动 ， 那 么 得 到 的 历 


史 质 量 评价 结果 就 会 较 低 。 
史 评 价 (HQ) 


因此 ， 在 科学 家 研究 合作 网 络 的 历 
结果 中 ， 本 文 得 到 的 结果 低 于 ECSD 算法 ， 说 明 


网 络 和 社区 结构 在 不 同时 间 跳 之 间 发 生 了 较 大 变化 ， 验 证 了 本 
文 的 算法 (ECDA) 对 网 络 结构 的 变化 和 社区 结构 的 变化 更 加 敏 


锐 。 


这 里 ， 本 文 同样 在 该 科学 家 研究 合作 网 络 数 据 集中 ) 


在 表 4 中 给 出 了 本 文 的 算法 (ECDA) 在 科学 家 研究 合作 
价 结果 (SQ)、 


历史 评价 结果 (HQ) 和 整体 评 


价 结果 TQ) 的 详细 


信息 。 在 时 间 跳 1996 年 时 ， 由 于 没有 历 


史 网 络 信息 和 历史 社区 结 
且 通 过 第 二 部 分 的 介绍 可 


质量 评价 。 


构 信息 ， 所 以 没有 历史 评价 结果 ， 而 
知 ， 此 时 的 快照 质量 评价 就 等 于 整体 


表 4 在 科学 家 研究 合作 网 络 中 每 个 时 间 跳 的 


SQ、HQ 和 TQ 的 评价 结果 


质量 评价 1996 1997 1998 1999 
SQ 0.444 0.660 0.781 0.602 
HQ 0.389 0.280 0.063 
TQ 0.444 0.627 0.678 0.550 

质量 评价 2000 2001 2002 2003 
SQ 0.475 0.479 0.449 0.374 
HQ 0.352 0.368 0.291 0.209 
TQ 0.481 0.488 0.455 0.367 


在 这 里 , 同样 本 文 给 出 了 ECDA 算法 在 该 科学 家 研究 合作 


提出 的 ECDA 算法 与 PDG 算法 、InfoMap 算法 和 ECSD 算法 


] 本文 


结果 如 图 


8 所 示 。 


模块 度 质量 评价 结果 


一 上 一 InfoMap 


0 
1996 1997 1998 1999 2000 2001 2002 2003 


时 间 跳 序列 


图 8 在 科学 家 研究 合作 网 络 中 ,本 文 提 


进行 了 每 个 时 间 跳 社区 划分 结果 质量 的 模块 度 对 比 实验 。 


实验 


出 的 ECDA 算法 与 PDG 算法 、 


InfoMap 算法 和 ECSD 算法 的 社区 划分 结果 质量 的 模块 度 对 比 


从 图 8 中 可 
区 划分 结果 。 除 了 在 时 间 跳 2001 时 


< 去 


以 看 出 ,本文 提出 的 ECDA 算法 
得 到 的 模块 度 


算法 外 , 其 他 都 具 
算法 与 其 他 算法 相 比 


有 较 好 的 竞争 力 。 


了 较 好 的 划分 结果 。 验 说 


E 了 本 文 


了 较 好 的 社 
咯 低 于 PDG 
提出 的 ECDA 


录用 稿 


4 ”结束 语 


本 文 提 出 了 一 种 动态 加 权 网 络 中 的 演化 社区 发 现 算法 
CECDA)。 该 算法 可 以 自动 发 现 动态 加 权 网 络 中 每 个 时 间 跳 的 
社区 结构 。 该 算法 在 人 工 数据 集 和 真实 数据 集中 进行 了 实验 ， 
实验 结果 证 明 该 算法 可 以 有 效 地 发 现 动态 加 权 网 络 中 的 社区 结 
构 ， 与 其 他 算法 对 比 具有 较 好 的 竞争 力 。 而 且 实 验证 明 该 算法 
对 动态 加 权 网 络 结构 的 变化 和 社区 结构 的 变化 更 具有 敏锐 性 。 
但 是 ， 该 算法 依然 存在 不 足 ， 该 算法 不 能 用 在 有 向 网 络 中 ; 而 
且 如 何 分 析 在 不 同时 间 跳 社区 结构 具体 的 变化 情况 依然 是 一 个 
研究 热点 问题 。 
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